Empecemos con algo pequeño… Una legislatura.
La XIV legislatura de las Cortes Españolas (2019-2023):
273 sesiones plenarias (ordinarias y extraordinarias)
43.410 intervenciones de los diputados
12.173.858 palabras
Retos:
¿Cómo identificar las intervenciones que hablan de violencia e inmigración?
¿Cómo medir la importancia de estos temas a lo largo del tiempo?
¿Cómo comparar la atención data por los partidos a estos temas?
¿Cómo visualizar los resultados de forma clara y comprensible?
¿Cómo medir procesos extendidos en el tiempo?
Partidos cambian de posición
Temas emergen y desaparecen
Estrategias discursivas evolucionan y cambian
El contexto político también cambia
Erosión democrática en El Salvador
Bukele llega al poder en junio de 2019
PERO con minoría parlamentaria
Mayo de 2021: gana mayoría en la Asamblea
2022: declara un “Régimen de Excepción” (que dura hasta hoy)
Objeto:
Posiciones de los partidos sobre la erosión democrática
Fuente:
Actas de sesiones de la Asamblea Legislativa (2018-2025)
Dimensiones:
7 años, 2 1/3 legislaturas, 42.526 intervenciones, 12.605.902 palabras
La práctica política se documenta en toneladas de texto
Se trata de un material sin estructurar, PERO…
Una fuente riquísima de información
Muchos son documentos públicos y accesibles
Su documentación es sistemática y obligada con base a requisitos legales o administrativos
En muchos casos, representan censos o una “huella digital” de la actividad política
Su producción y distribución son cada vez más digitales
Cómo analizar un tema en un conjunto enorme de textos?
Dimensión del problema:
Miles de páginas y documentos
Varios millones de palabras
¿Cómo lo haríamos?
Análisis cualitativo tradicional
Análisis de contenido cuantitativo
Dado en volumen de datos, el análisis cualitativo tradicional se dificulta mucho:
¿Cómo identificar qué sirve y qué no sin caer en sesgos?
¿Cómo determinar el peso relativo de un tema en centenares o miles de documentos?
¿Cómo comparar textos entre sí?
R - un lenguaje de programación y un entorno para el análisis estadístico
No está pensando para el análisis de textos, pero:
Es muy flexible y adaptable
Gran poder de visualización de datos
Facilidad en integrar métodos cuanti con cuali
R tiene varias librerías para el análisis de textos
quanteda
tidytext
stringi / stringr (versión tidy de stringi)
tm
QDA
text
topicmodels
tenet
Se pueden llevar a cabo desde análisis hasta muy complejos
Discursos de investidura de los presidentes del Gobierno de España (1977-2023)
Frecuencia de palabras
Ahora sin stopwords, puntuación y números
Discursos de investidura de los presidentes del Gobierno de España (1977-2023)
Mariano Rajoy

Pedro Sánchez

El análisis de textos políticos con R permite manejar grandes volúmenes de datos textuales de manera eficiente y reproducible.
R ofrece una amplia gama de herramientas para el análisis cuantitativo y cualitativo de textos, desde la frecuencia de palabras hasta el análisis temático y las redes semánticas.
La combinación de métodos cuantitativos y cualitativos en R permite obtener una comprensión más profunda y matizada de los textos políticos.